字节跳动

字节跳动发布Seaweed-7B视频模型,AI视频生成迈向新高度

人工智能视频生成领域迎来新的里程碑。AIbase从社交媒体获悉,字节跳动近期发布了其全新视频生成模型Seaweed-7B的论文与演示,展示了一系列突破性功能,包括音视频同步生成、长镜头叙事和实时高分辨率生成。这一发布标志着字节跳动在AI视频技术上的加速布局,以下是AIbase对Seaweed-7B的深度报道,解析其技术亮点与行业影响。Seaweed-7B震撼亮相:多功能视频生成Seaweed-7B

字节跳动推出DreamActor-M1项目,挑战Runway Act-One的AI角色表演技术

字节跳动近日推出其全新AI项目DreamActor-M1,该项目旨在实现类似Runway Act-One的功能,通过先进的生成式AI技术,将视频中的角色表演转化为虚拟动画,展现出更高的精确度和表现力。这一消息迅速引发了业界和网友的广泛关注,被视为字节跳动在AI视频生成领域迈出的又一大步。技术突破:超越Runway Act-One的野心据公开信息显示,DreamActor-M1的核心目标是捕捉演员的

字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模

大动作!字节AI Lab并入Seed,AI布局迎新变

据AI科技评论消息,近日字节AI Lab即将全部并入Seed团队,这一变动标志着字节内部AI研发架构迎来重大调整。据悉。字节AI Lab成立于 2016 年,曾是字节跳动AI研发的核心部门,由马维英负责,直接向张一鸣汇报。当时团队规模达 150 人,研究覆盖人工智能前沿技术,字节的推荐算法、短视频特效等都源于此,为抖音等产品的崛起立下汗马功劳,也助力字节在国内AI领域领先。但后来随着抖音、TikT

字节跳动发布高效预训练长度缩放技术,突破长序列训练瓶颈

字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框

字节Seedream 3.0 文生图模型技术报告发布:多项性能大幅升级

字节跳动Seed团队正式发布了Seedream3.0文生图模型的技术报告。这一模型在性能上实现了重大提升,是一个原生高分辨率、支持中英双语的图像生成基础模型,在分辨率、生图结构准确性等多方面取得突破,与上一版本相比优势显著。Seedream3.0在不同维度上的表现。本图各维度数据以最佳指标为参照系,已进行归一化调整。在功能亮点上,Seedream3.0可原生2K直出,无需后处理就能输出高分辨率图像

传字节跳动AI眼镜有新动作! 已和供应商“搭上线”

快科技4月13日消息,近日,有媒体报道,有知情人士透露了字节跳动在AI硬件领域的又一重大布局计划推出自家的AI智能眼镜。据悉,字节跳动自去年起便已启动AI眼镜项目。公司积极招募具备硬件设计经验的工程师加入开发团队,全力攻克技术难题。其中,如何在不显著影响电池续航的情况下,保障眼镜拍摄出高质量的图像和视频,成为亟待解决的关键问题。目前,该产品的核心功能仍处于保密阶段,具体推出时间和销售地区也尚未

字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破

北京——字节跳动(ByteDance)近日在人工智能开源社区Hugging Face上正式发布了其最新的文本转语音(TTS)模型MegaTTS3。这一发布迅速引起了全球AI研究者和开发者的关注,因其在轻量化设计和多语言支持方面的突破性表现。根据技术社区反馈和官方信息,MegaTTS3 被誉为语音合成领域的一次重要进步。MegaTTS3 的核心亮点MegaTTS3 是一款由字节跳动与浙江大学合作开发

提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。Multi-SWE

字节跳动启动 “Top Seed” 计划,面向 2026 届博士生招募 AI 人才

字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划,计划招募约30位优秀博士生。这一项目专注于前沿的人工智能领域,涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。字节跳动希望通过此举,吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。与以往的招聘计划不同,本届 “Top Seed” 强调 “不限专业背景”,更加关注应聘者的研究潜力与热情。